This paper describes our two-stage system for the Euphemism Detection shared task hosted by the 3rd Workshop on Figurative Language Processing in conjunction with EMNLP 2022. Euphemisms tone down expressions about sensitive or unpleasant issues like addiction and death. The ambiguous nature of euphemistic words or expressions makes it challenging to detect their actual meaning within a context. In the first stage, we seek to mitigate this ambiguity by incorporating literal descriptions into input text prompts to our baseline model. It turns out that this kind of direct supervision yields remarkable performance improvement. In the second stage, we integrate visual supervision into our system using visual imageries, two sets of images generated by a text-to-image model by taking terms and descriptions as input. Our experiments demonstrate that visual supervision also gives a statistically significant performance boost. Our system achieved the second place with an F1 score of 87.2%, only about 0.9% worse than the best submission.
translated by 谷歌翻译
我们提出了一种方法,通过将知识存储在外部知识图(kg)中,并使用密集的索引从该kg中检索,使自然语言理解模型更有效地有效。给定(可能是多语言的)下游任务数据,例如德语中的句子,我们从kg中检索实体,并使用其多模式表示形式来改善下游任务绩效。我们使用最近发布的VisualSem KG作为我们的外部知识存储库,涵盖了Wikipedia和WordNet实体的子集,并比较基于元组和基于图的算法的混合,以学习基于KG多模式信息的实体和关系表示。 。我们在两个下游任务上展示了学识渊博的实体表示形式的有用性,并在多语言命名实体识别任务上的性能提高了$ 0.3 \%$ - $ 0.7 \%\%$ f1,而我们的准确度最高为$ 2.5 \%\%$ $提高。在视觉意义上的歧义任务上。我们所有的代码和数据都提供:\ url {https://github.com/iacercalixto/visualsem-kg}。
translated by 谷歌翻译
我们提出Valse(视觉和语言结构化评估),这是一种新的基准,专为测试通用净化的视觉和语言(V&L)模型而设计,用于对特定语言现象的视野 - 语言接地能力。Valse提供涵盖各种语言构建体的六种测试套件。解决这些需要模型在视觉模型中地对语言现象,允许比迄今为止更细粒度的评估。我们使用支持有效箔的构造的方法构建Valse,并通过评估五种广泛使用的V&L模型的报告结果。我们的实验表明,目前的模型有很大的困难解决了大多数现象。因此,我们预计Valse就可以作为一种重要的基准,从语言角度来衡量预训过的V&L模型的未来进展,补充规范任务为中心的V&L评价。
translated by 谷歌翻译
HashTag分段,也称为HashTag分解,是用于社交媒体数据集的预处理流水线的共同步骤。它通常先于情绪分析和仇恨语音检测等任务。对于中期到低资源语言的情感分析,以前的研究表明,一种多语言方法,即机器翻译的多语言方法可以竞争或优于任务的先前方法。我们开发了零拍摄具有零点的分割框架,并演示了如何用于提高多语言情感分析管道的准确性。我们的零拍摄框架为HASHTAG分割数据集建立了新的最先进的,甚至超过了以前的方法,依赖于在域内数据的特征工程和语言模型。
translated by 谷歌翻译